C 19-25 编译及预编译

19 编译过程简介

初识编译器

你不知道的事......

预编译

处理所有的注释，以空格代替
将所有的#define删除，并展开所有的宏定义
处理条件编译指令#if,#ifdef,#elif,#else,#endif
处理#include，展开被包含的文件
保留编译器需要使用的#pragma指令

预处理指令示例：gcc -E file.c -o file.i

编译

对预处理文件进行词法分析，语法分析和语义分析
- 词法分析：分析关键字，标示符，立即数等是否合法
- 语法分析：分析表达式是否遵循语法规则
- 语义分析：在语法分析的基础上进一步分析表达式是否合法
分析结束后进行代码优化生成相应的汇编代码文件

编译指令示例：gcc -S file.i -o file.s

汇编

汇编器将汇编代码转变为机器的可以执行命令
每条汇编语句几乎都对应一条机器指令

汇编指令示例：gcc -c file.s -o file.o

编程实验

源码单步编译示例

/*

    This is a header file.
    
*/

char* p = "Hello";

int i = 0;

#include "19-1.h"

// Begin to define macro

#define GREETING "Hello world!"

#define INC(x) x++

// End

int main() {   
    p = GREETING;
    INC(i);
    return 0;
}

小结

编译过程分为预处理，编译，汇编和链接四个阶段
- 预处理：处理注释，宏以及已经以#开头的符号
- 编译：进行词法分析，语法分析和语义分析等
- 汇编：将汇编代码翻译为机器指令的目标文件

20 链接过程简介

问题：工程中的每个C语言源文件被编译后产生目标文件，这些目标文件如何生成最终的可执行程序？

链接器的主要作用是把各个模块之间相互引用的部分处理好，使得各个模块之间能够正确的衔接。

静态链接

由编译器在链接时将库的内容直接加入到可执行程序中

Linux下静态库的创建和使用

编译静态库源码：gcc -c lib.c -o lib.o
生成静态库文件：ar -q lib.a lib.o
使用静态库编译：gcc main.c lib.a -o main.out

编程实验

静态链接示例

//slib.c
char* name()
{
    return "Static Lib";
}


int add(int a, int b) {
    return a + b;
}

#include <stdio.h>

extern char* name();
extern int add(int a, int b);

int main() {
    printf("Name: %s\n", name());
    printf("Result: %d\n", add(2, 3));

    return 0;
}

动态链接

可执行程序在运行时才动态加载库进行链接；库的内容不会进入可执行程序中

Linux下动态库的创建和使用

编译动态库源码：gcc -shared dlib.c -o dlib.so
使用动态库编译：gcc main.c -ldl -o main.out
关键系统调用
- dlopen:打开动态库文件
- dlsym:查找动态库中的函数并返回调用地址
- dlclose:关闭动态库文件

编程实验

动态链接示例

//dlib.c

char* name() {
    return "Dynamic Lib";
}


int add(int a, int b) {
    return a + b;
}

#include <stdio.h>
#include <dlfcn.h>

int main() {
    void* pdlib = dlopen("./dlib.so", RTLD_LAZY);

    char* (*pname)();
    int (*padd)(int, int);

    if( pdlib != NULL ) {
        pname = dlsym(pdlib, "name");
        padd = dlsym(pdlib, "add");
 
        if( (pname != NULL) && (padd != NULL) )
        {
            printf("Name: %s\n", pname());
            printf("Result: %d\n", padd(2, 3));
        }

        dlclose(pdlib);
    } else {
        printf("Cannot open lib ...\n");
    }
    return 0;
}

小结

链接是将目标文件最终链接为可执行程序
根据链接方式的不同，链接过程可以分为：
- 静态链接：目标文件直接链接进入可执行程序
- 动态链接：在程序启动后才动态加载目标文件

21 宏定义与使用分析

#define是预处理器处理的单元实体之一；#define定义的宏可以出现在程序的任意位置；#define定义之后的代码都可以使用这个宏；#define定义的宏常量可以直接使用；#define定义的宏常量本质为字面量。

下面的宏常量定义正确吗？

#define ERROR -1
#define PATH1 "D:\test\test.c"
#define PATH2 D:\test\test.c
#define PATH3 D:\test\
test.c

实例分析

宏定义分析

#define ERROR -1
#define PATH1 "D:\test\test.c"
#define PATH2 D:\test\test.c
#define PATH3 D:\test\
test.c

int main()
{
    int err = ERROR;
    char* p1 = PATH1;
    char* p2 = PATH2;
    char* p3 = PATH3;
}

#define表达式的使用类似函数调用
#define表达式可以比函数更强大
#define表达式比函数更容易出错

下面的宏表达式定义正确吗？

#define _SUM_(a,b) (a)+(b)
#define _MIN_(a,b) ((a)<(b)?(a):(b))
#define _DIM_(a) sizeof(a)/sizeof(*a)

实例分析

宏表达式分析

// #include <stdio.h>

#define _SUM_(a, b) (a) + (b)
#define _MIN_(a, b) ((a) < (b) ? (a) : (b))
#define _DIM_(a) sizeof(a)/sizeof(*a)


int main()
{
    int a = 1;
    int b = 2;
    int c[4] = {0};

    int s1 = _SUM_(a, b);
    int s2 = _SUM_(a, b) * _SUM_(a, b);
    int m = _MIN_(a++, b);
    int d = _DIM_(c);

    // printf("s1 = %d\n", s1);
    // printf("s2 = %d\n", s2);
    // printf("m = %d\n", m);
    // printf("d = %d\n", d);

    return 0;
}

宏表达式被预处理器处理，编译器不知道宏表达式的存在
宏表达式用“实参”完全替代形参，不进行任何运算
宏表达式没有任何的“调用开销”
宏表达式中不能出现递归定义

#define _SUM_(n) ((n>0)?(_SUM(n-1)+n):0)
int s = _SUM_(10);

宏定义的常量表达式是否有作用域限制？

下面的程序合法吗？

void def(){
    #define PI 3.1415926
    #define AREA(r) r*r*PI
}
double area(double r){
    return AREA(r);
}

实例分析：宏的作用域分析

// #include <stdio.h>

void def()
{
    #define PI 3.1415926
    #define AREA(r) r * r * PI
}

double area(double r)
{
    return AREA(r);
}

int main()
{
    double r = area(5);

    // printf("PI = %f\n", PI);
    // printf("d = 5; a = %f\n", r);
    
    return 0;
}

强大的内置宏

宏	含义	示例
_FILE_	被编译的文件名	file1.c
_LINE_	当前行号	25
_DATE_	编译时的日期	Jan 31 2012
_TIME_	编译时的时间	17:01:01
_STDC_	编译器是否遵循标准C规范	1

实例分析

宏使用综合示例

#include <stdio.h>
#include <malloc.h>

#define MALLOC(type, x) (type*)malloc(sizeof(type)*x)

#define FREE(p) (free(p), p=NULL)

#define LOG(s) printf("[%s] {%s:%d} %s \n", __DATE__, __FILE__, __LINE__, s)

#define FOREACH(i, m) for(i=0; i<m; i++)
#define BEGIN {
#define END }

int main()
{
    int x = 0;
    int* p = MALLOC(int, 5);
    
    LOG("Begin to run main code...");
    
    FOREACH(x, 5)
    BEGIN
        p[x] = x;
    END
    
    FOREACH(x, 5)
    BEGIN
        printf("%d\n", p[x]);
    END
    
    FREE(p);
    
    LOG("End");
    
    return 0;
}

小结

预处理器直接对宏进行文本替换
宏使用时的参数不会进行求值和运算
预处理器不会对宏定义进行语法检查
宏定义时出现的语法错误只能被编译器检测
宏定义的效率高于函数调用
宏的使用会带来一定的副作用

22 条件编译使用分析

条件编译的行为类似于C语言中的if...else...
条件编译是预编译器指示命令，用于控制是否编译某段代码

#define C 1
int main(){
    #if(C==1)
        printf("This is first printf...\n");
    #else
        printf("This is second printf...\n")
    #endif
    return 0;
}

实例分析

条件编译初探

// #include <stdio.h>

#define C 1

int main()
{
    const char* s;

    #if( C == 1 )
        s = "This is first printf...\n";
    #else
        s = "This is second printf...\n";
    #endif

    // printf("%s", s);
    
    return 0;
}

预编译器根据条件编译指令有选择的删除代码
编译器不知道代码分支的存在
if...else...语句在运行期进行分支判断
条件编译指令在预编译期进行分支判断
可以通过命令行定义宏

gcc -Dmacro=value file.c或gcc -Dmacro file.c

编程实验

通过命令行定义宏

//#include <stdio.h>

int main()
{
    const char* s;

    #ifdef C
        s = "This is first printf...\n";
    #else
        s = "This is second printf...\n";
    #endif

    //printf("%s", s);
    
    return 0;
}

#include的本质是将已经存在的文件内容嵌入到当前文件中
#include的间接包含同样会产生嵌入文件内容的操作

问题：间接包含同一个头文件是否会产生编译错误？

实例分析

条件编译的使用

// global.h
#ifndef _GLOBAL_H_
#define _GLOBAL_H_
int global = 10;

#endif

// test.h

#ifndef _TEST_H_
#define _TEST_H_
#include "global.h"const char* NAME = "test.h";char* hello_world(){ return "Hello world!\n";}

#endif

//main.c
// #include <stdio.h>
#include "test.h"
#include "global.h"

int main() {
    const char* s = hello_world();
    int g = global;
    
    // printf("%s\n", NAME);
    // printf("%d\n", g);
    
    return 0;
}

条件编译可以解决头文件重复包含的编译错误

#ifdef _HEADER_FILE_H_
#define _HEADER_FILE_H_
//source code
#endif

条件编译使得我们可以按照不同的条件编译不同的代码段，因为可以产生不同的目标代码
#if...#else...#endif被预编译器处理，而if...else...语句被编译器处理，必然被编译进目标代码
实际工程中条件编译主要用于以下两种情况：
- 不同的产品线共用同一份代码
- 区分编译产品的调试版和发布版

实例分析

产品线区分及调试代码应用

//product.h
#define DEBUG 1
#define HIGH 1

//main.c
#include <stdio.h>
#include "product.h"

#if DEBUG
    #define LOG(s) printf("[%s:%d] %s\n", __FILE__, __LINE__, s)
#else
    #define LOG(s) NULL
#endif

#if HIGH
void f()
{
    printf("This is the high level product!\n");
}
#else
void f()
{
}
#endif

int main() {
    LOG("Enter main() ...");
    
    f();
    
    printf("1. Query Information.\n");
    printf("2. Record Information.\n");
    printf("3. Delete Information.\n");
    
    #if HIGH
    printf("4. High Level Query.\n");
    printf("5. Mannul Service.\n");
    printf("6. Exit.\n");
    #else
    printf("4. Exit.\n");
    #endif
    
    LOG("Exit main() ...");
    
    return 0;
}

小结

通过编译器命令行能够定义预处理器使用的宏
条件编译可以避免重复包含同一个头文件
条件编译是在工程中可以区别不同产品线的代码
条件编译可以定义产品的发布版和调试版

23#error和#line使用分析

#error用于生成一个编译错误消息
用法

#error message

message不需要用双引号包围 #error编译指示字用于自定义程序员特有的编译错误消息；类似的，#warning用于生成编译警告。

#error是一种预编译指示字
#error可用于提示编译条件是否满足

#idndef __cplusplus
    #error This file should be processed with C++ compiler.
#endif

编译过程中的任意错误信息意味着无法生成最终的可执行程序。

实例分析：#error预处理初探

#include <stdio.h>

#ifndef __cplusplus
    #error This file should be processed with C++ compiler.
#endif

class CppClass {
private:
    int m_value;
public:
    CppClass() { }
    ~CppClass() { }
};

int main() {
    return 0;
}

#error在条件编译中的应用

#include <stdio.h>

void f() {
#if ( PRODUCT == 1 )
    printf("This is a low level product!\n");
#elif ( PRODUCT == 2 )
    printf("This is a middle level product!\n");
#elif ( PRODUCT == 3 )
    printf("This is a high level product!\n");
#endif
}

int main() {
    f();
    
    printf("1. Query Information.\n");
    printf("2. Record Information.\n");
    printf("3. Delete Information.\n");

#if ( PRODUCT == 1 )
    printf("4. Exit.\n");
#elif ( PRODUCT == 2 )
    printf("4. High Level Query.\n");
    printf("5. Exit.\n");
#elif ( PRODUCT == 3 )
    printf("4. High Level Query.\n");
    printf("5. Mannul Service.\n");
    printf("6. Exit.\n");
#endif
    
    return 0;
}

#line用于强制指定新的行号和编译文件名，并对源程序的代码重新编号，用法：

#line number filename

filename可省略，#line编译指示字的本质是重定义__LINE__和__FILE__

编程实验

#line的使用

#include <stdio.h>

// The code section is written by A.
// Begin
#line 1 "a.c"

// End

// The code section is written by B.
// Begin
#line 1 "b.c"

// End

// The code section is written by Delphi.
// Begin
#line 1 "delphi_tang.c"


int main()
{
    printf("%s : %d\n", __FILE__, __LINE__);
    
    printf("%s : %d\n", __FILE__, __LINE__);
    
    return 0;
}

// End

小结

#error用于自定义一条编译错误信息
#warning用于自定义一条编译警告信息
#error和#warning常应用于条件编译的情形
#line用于强制指定新的行号和编译文件名

24 #pragma使用分析

#pragma用于指示编译器完成一些特定的动作
#pragma所定义的很多指示字是编译器特有的
#pragma在不同的编译器间是不可移植的
- 预处理器将忽略它不认识的#pragma指令
- 不同的编译器可能以不同的方式解释同一条#pragma指令

一般用法：

#pragma parameter

注：不同的parameter参数语法和意义各不相同

#pragma message

message参数在大多数的编译器都有相似的实现
message参数在编译时输出消息到编译输出窗口中
message用于条件编译中可提示代码的版本信息

#if defined(ANDROID20)
    #pragma message("Compile Android SDK 2.0...")
    #define VERSION "Android 2.0"
#endif

与#error和#warning不同，#pragma message仅仅代表一条编译消息，不代表程序错误。

实例分析：`#pragma message`使用示例

#include <stdio.h>

#if defined(ANDROID20)
    #pragma message("Compile Android SDK 2.0...")
    #define VERSION "Android 2.0"
#elif defined(ANDROID23)
    #pragma message("Compile Android SDK 2.3...")
    #define VERSION "Android 2.3"
#elif defined(ANDROID40)
    #pragma message("Compile Android SDK 4.0...")
    #define VERSION "Android 4.0"
#else
    #error Compile Version is not provided!
#endif

int main()
{
    printf("%s\n", VERSION);

    return 0;
}

#pragma once

#pragma once用于保证头文件只被编译一次
#pragma once是编译器相关的，不一定被支持

#ifndef HEADER_FILE_H
#define HEADER_FILE_H
//source code
#endif

#pragma once

上面这两种方式有什么区别？

实例分析：`#pragma once`使用分析

//global.h
#pragma once

int g_value = 1;

#include <stdio.h>
#include "global.h"
#include "global.h"

int main()
{
    printf("g_value = %d\n", g_value);

    return 0;
}

#pragma pack

什么是内存对齐？
- 不同类型的数据在内存中按照一定的规则排列
- 而不一定是顺序的一个接一个的排列

struct Test1{
    char c1;
    short s;
    char c2;
    int i;
};
struct Test2{
    char c1;
    char 2;
    short s;
    int i;
};

Test1和Test2所占的内存空间是否相同？

为什么需要内存对齐？
- CPU对内存的读取不是连续的，而是分成块读取的，块的大小只能是1、2、4、8、16...字节
- 当读取操作的数据未对齐，则需要两次总线周期来访问内存，因此性能会大打折扣
- 某些硬件平台只能从规定的相对地址处读取特定类型的数据，否则产生硬件异常
#pragma pack用于指定内存对齐方式
#pramga pack能够改变编译器的默认对齐方式

#pragma pack(1)
struct Test1{
    char c1;
    short s;
    char c2;
    int i;
};
##pragma pack()

#pragma pack(1)
struct Test2{
    char c1;
    char c2;
    short s;
    int i;
};
##pragma pack()

//sizeof(struct Test1) = ?
//sizeof(struct Test1) = ?

struce占用的内存大小
- 第一个成员起始于0偏移处
- 每个成员按其类型大小和pack参数中较小的一个进行对齐
  - 偏移地址必须能被对齐参数整除
  - 结构体成员的大小取其内部长度最大的数据成员作为其大小
- 结构体总长度必须为所有对齐参数的整数倍

编译器在默认情况下按照4字节对齐。

编程实验

结构体大小计算

#include <stdio.h>

#pragma pack(2)
struct Test1
{
    char c1;
    short s;
    char c2;
    int i; 
};
#pragma pack()

#pragma pack(4)
struct Test2
{
    char c1;
    char c2;
    short s;
    int i;
};
#pragma pack()

int main()
{
    printf("sizeof(Test1) = %d\n", sizeof(struct Test1));
    printf("sizeof(Test2) = %d\n", sizeof(struct Test2));

    return 0;
}

#include <stdio.h>

#pragma pack(8)

struct S1
{
    short a;
    long b;
};

struct S2
{
    char c;
    struct S1 d;
    double e;
};

#pragma pack()

int main()
{
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));

    return 0;
}

小结

#pragma用于指示编译器完成一些特定的动作
#pragma所定义的很多指示字是编译器特有的
- #pragma message用于自定义编译消息
- #pragma once用于保证头文件只被编译一次
- #pragma pack用于指定内存对齐方式

25 #和##操作符使用分析

#操作符用于在预处理期将宏参数转换为字符串
#的转换作用是在预处理期完成的，因此只在宏定义中有效
编译器不知道#的转换作用
用法

#define STRING(x) #x
printf("%s\n",STRING(Hello World!));

实例分析

#运算符的基本用法

#include <stdio.h>

#define STRING(x) #x

int main()
{
    
    printf("%s\n", STRING(Hello world!));
    printf("%s\n", STRING(100));
    printf("%s\n", STRING(while));
    printf("%s\n", STRING(return));

    return 0;
}

#运算符的妙用

#include <stdio.h>

#define CALL(f, p) (printf("Call function %s\n", #f), f(p))
   
int square(int n)
{
    return n * n;
}

int func(int x)
{
    return x;
}

int main()
{
    int result = 0;
    
    result = CALL(square, 4);
    
    printf("result = %d\n", result);
    
    result = CALL(func, 10);
    
    printf("result = %d\n", result);

    return 0;
}

##运算符

##运算符用于在预处理期粘贴两个标识符
##的连接作用是在预处理期完成的，因此只在宏定义中有效
编译器不知道##的连接作用
用法

#define CONNECT(a,b)    a##b
int CONNECT(a,1);    //int a1;
a1=2;

实例分析

##运算符的基本用法

#include <stdio.h>

#define NAME(n) name##n

int main()
{
    
    int NAME(1);
    int NAME(2);
    
    NAME(1) = 1;
    NAME(2) = 2;
    
    printf("%d\n", NAME(1));
    printf("%d\n", NAME(2));

    return 0;
}

##运算符的工程应用

#include <stdio.h>

#define STRUCT(type) typedef struct _tag_##type type;\
                     struct _tag_##type

STRUCT(Student)
{
    char* name;
    int id;
};

int main()
{
    
    Student s1;
    Student s2;
    
    s1.name = "s1";
    s1.id = 0;
    
    s2.name = "s2";
    s2.id = 1;
    
    printf("s1.name = %s\n", s1.name);
    printf("s1.id = %d\n", s1.id);
    printf("s2.name = %s\n", s2.name);
    printf("s2.id = %d\n", s2.id);

    return 0;
}

小结

#运算符用于在预处理期将宏参数转换为字符串
##运算符用于在预处理期粘贴两个标识符
编译器不知道#和##运算符的存在
#和##运算符只在宏定义中有效

19 编译过程简介​

初识编译器​

你不知道的事......​

预编译​

编译​

汇编​

编程实验​

小结​

20 链接过程简介​

静态链接​

Linux下静态库的创建和使用​

编程实验​

动态链接​

Linux下动态库的创建和使用​

编程实验​

小结​

21 宏定义与使用分析​

实例分析​

实例分析​

宏定义的常量表达式是否有作用域限制？​

实例分析：宏的作用域分析​

强大的内置宏​

实例分析​

小结​

22 条件编译使用分析​

实例分析​

编程实验​

实例分析​

实例分析​

小结​

23#error和#line使用分析​

实例分析：#error预处理初探​

编程实验​

小结​

24 #pragma使用分析​

#pragma message​

实例分析：#pragma message使用示例​

#pragma once​

实例分析：#pragma once使用分析​

#pragma pack​

编程实验​

小结​

25 #和##操作符使用分析​

实例分析​

##运算符​

实例分析​

小结​

19 编译过程简介

初识编译器

你不知道的事......

预编译

编译

汇编

编程实验

小结

20 链接过程简介

静态链接

Linux下静态库的创建和使用

编程实验

动态链接

Linux下动态库的创建和使用

编程实验

小结

21 宏定义与使用分析

实例分析

实例分析

宏定义的常量表达式是否有作用域限制？

实例分析：宏的作用域分析

强大的内置宏

实例分析

小结

22 条件编译使用分析

实例分析

编程实验

实例分析

实例分析

小结

23#error和#line使用分析

实例分析：#error预处理初探

编程实验

小结

24 #pragma使用分析

#pragma message

实例分析：`#pragma message`使用示例

#pragma once

实例分析：`#pragma once`使用分析

#pragma pack

编程实验

小结

25 #和##操作符使用分析

实例分析

##运算符

实例分析

小结